Agent 编排(Agent Orchestration)
多 Agent 协作的调度引擎 — 决定何时调用哪个 Agent、Agent 间如何传递上下文、出错如何回退。是从 "单一 LLM 调用" 跨越到 "复杂工作流自动化" 的关键中间件层。
定义
Agent 编排框架提供:
- Agent 注册与发现 — 每个 Agent 的能力描述、所需输入
- 任务拆分与分派 — 把用户请求拆成子任务、分给合适 Agent
- 上下文传递 — Agent 间状态、记忆、消息共享
- 执行控制 — 顺序、并行、条件分支、循环、超时
- 错误处理 — 重试、降级、回退到人工
- 工具调用 — 通过 MCP Server 或 Function Call 调用外部工具
- 审计与追踪 — 与 AgentOps 集成
主流编排框架
| 框架 | 出品方 | 特点 |
|---|---|---|
| LangChain | LangChain Inc. | 通用框架,最早 |
| LangGraph | LangChain Inc. | 基于状态机的图编排,复杂工作流 |
| AutoGen | Microsoft Research | 多 Agent 对话式编排 |
| CrewAI | 独立团队 | 角色化(CEO/工程师/分析师)协作 |
| OpenAI Swarm | OpenAI | 轻量级、教学性质 |
| Semantic Kernel | Microsoft | 企业级 .NET / Python |
| LlamaIndex AgentWorkflow | LlamaIndex | 与 RAG 深度结合 |
| 阿里云 AI 中间件 | 阿里云(2025 云栖发布) | Agent 编排基座 + 工具调用 |
编排模式
| 模式 | 描述 | 典型场景 |
|---|---|---|
| 链式(Chain) | A → B → C 顺序 | RAG、简单文档处理 |
| 路由(Router) | 根据意图分发到不同 Agent | 客服分流 |
| 图(Graph / State Machine) | 复杂条件 + 循环 + 子图 | 自主决策工作流 |
| 协作(Crew) | 多角色协作(CEO/分析师/工程师) | 软件开发、内容创作 |
| 对话(Conversation) | Agent 互相对话 | 辩论、Code Review |
| 层级(Hierarchical) | Manager Agent 调度 Worker Agent | 大型任务分解 |
关键挑战
- 状态管理 — Agent 间共享上下文易导致 token 成本爆炸
- 循环检测 — Agent 互相调用易陷入无限循环
- 错误传播 — 一个 Agent 失败如何不影响整个工作流
- 可观测性 — trace 树指数增长,必须配 AgentOps
- 成本控制 — N 个 Agent × 多轮调用 → 单任务 $几十-几百
- 工具标准化 — 各家 Agent 工具协议不兼容 → MCP Server 试图统一
商业化进展
- 2025-云栖大会:阿里云 发布 AI 中间件,强调 Agent 编排基座
- Databricks Agent Framework — 与 Mosaic AI 整合
- Datadog AI SRE Agent — 实际生产场景大规模铺开
演进
- 2023 AutoGPT / BabyAGI 引爆 Agent 概念
- 2024 LangChain → LangGraph 演进,CrewAI 兴起
- 2025 多 Agent 编排走向 企业级(阿里云 / Databricks / Datadog)
相关
∈ belongs_to::3-07-AI原生中间件与开发平台